معرفی مدلی ساختاری-احتمالاتی برای تبدیل حرف به واج در متون فارسی

نویسندگان

الهام علایی ابوذر

elham alayiaboozar iranian research institute for information science and technology (irandoc)تهران. خیابان انقلاب. چهار راه فلسطین. شماره 1090 محمود بی جن خان

mahmood bijankhan university of tehranتهران. خیابان انقلاب. دانشگاه تهران. دانشکده ادبیات و علوم انسانی. گروه زبانشناسی همگانی

چکیده

در نظام­های نوشتاری، رابطه یک-­به­-یک میان واج­ها و نگاره­ها همواره برقرار نیست. از آنجایی­که در نظام نوشتاری فارسی واکه­های کوتاه اغلب فاقد صورت نوشتاری هستند، تعداد حالت­های ممکن خواندن کلمات خارج از واژگان افزایش می­یابد و به این ترتیب عمق خط فارسی زیاد در نظر گرفته می­شود. اما علیرغم وجود چنین ویژگی­هایی در خط فارسی، فارسی­زبانان هنگام خواندن کلمات فارسی موجود در واژگان ذهنی خود و کلماتی که برای اولین بار با آن­ها در متون گوناگون مواجه می­شوند، قادرند رشته حروف را تبدیل به واج کنند. این پژوهش نشان می­دهد فارسی­زبانان با استفاده از روشی ساختاری-احتمالاتی، هنگام خواندن، رشته حروف را به رشته واج­ها تبدیل می­کنند. منظور از بخش ساختاری روش، استفاده فارسی­زبانان از اطلاعات زبانی از قبیل: ساختواژه فارسی، قواعد واژ­واجی فارسی و آشنایی با صورت نوشتاری و تلفظ کلماتی است که با الگوهای ساختواژی عربی مطابقت دارند. منظور از بخش احتمالاتی، در نظر گرفتن احتمال وقوع واکه­های کوتاه با توجه به بافت نوشتاری است که این واقعیت می­تواند فارغ از اطلاعات زبانی فارسی­زبانان صورت ­پذیرد. در تحقیق حاضر مدلی ساختاری-احتمالاتی معرفی و عملکرد آن با نرم­افزارهای تبدیل حرف به واج فارسی مقایسه شده است. به طور کلی این نتیجه به دست آمد که عملکرد مدل ساختاری-احتمالاتی پژوهش برای ارائه برونداد واجی کلمات خارج از واژگان، در مقایسه با نرم­افزارهای تبدیل حرف به واج فارسی بهتر و به تلفظ فارسی­زبانان نزدیک­تر است.

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

درباره مفهوم واج: نگاهی به فارسی

واج یک عنصر پایه است که از تقطیع کلام حاصل می شود. واج به عنوان یک طبقه در نظر گرفته می شود و نه یک عنصر ساده. این واقعیت با تحلیل قیاسی و سطوح بالاتر نشان داده شده است. واج ها دریافته های مختلف دارای نماد های آوایی متفاوتند. نمادهای آوایی واج ها نسبت به هم در وضعیت توزیع تکمیلی هستند و بنابراین ممیز معنا نیستند. از سوی دیگر واج ها می توانند ممیز باشند و در آن صورت در وضعیت توزیع مشابه اند. ممک...

متن کامل

بررسی خاستگاه واج /l/ در زبان فارسی

واج /l/ یکی از واج‌های زبان فارسی است که دارای چند منشأ متفاوت است. منشأ واج /l/ در شماری از واژه‌های زبان فارسی نیز مشخص نیست.این مقاله بر آن است تا با بررسی سیر تحوّل واج /l/ و واجهایی بپردازد که در زبان فارسی منجر به شکل‌گیری واج /l/ شده‌اند. در این خصوص سیر تحوّل واج /l/ در دیگر زبانهای خواهر ایرانی نیز بررسی شده است، چرا که این زبانها به نحوی در زبان فارسی تأثیر گذاشته‌اند. در این مورد، تح...

متن کامل

گروه حرف تعریف در فارسی شیرازی: رویکردی پوسته ای به گروه حرف تعریف

یده است تا در قالب طرحی (1988) به‌یات متأخر دستور گشتاری (بر‌مبنای شاخه‌بندی دوتایی، ازجمله نظریۀ اییره) ارائه داده است، توصیفی قابل‌قبول از گروه حرف تعریف در فارسی شیرازی به‌دست دهد. در این پژوهش، براساس طرح لارسن، برای حرف تعریف دو گروه پوسته‌ای با دو هستۀ حرف تعریف یۀ حرف تعریف، قبل و بعد از اسم، در این گونۀ زبانی، درصورتی توجیه‌پذیی در این پژوهش، ساخت‌واژی‌بودنِ حرف تعریفِ لایۀ دوم، دلیلی بر...

متن کامل

گروه حرف تعریف در زبان فارسی

این مقاله ضمن بررسی ساختمان گروه اسمی در زبان فارسی نشان داده است اکثر سازه‌های این گروه یا از هم مستقل‌اند یا وابسته‌های گروه موسوم به گروه حرف تعریف هستند. نگارنده تلاش کرده است در قالب تحلیلی یک‌دست، جایگاه ساختاری تمام سازه‌های مرتبط با موضوع این مقاله را براساس رویکرد کمینه‌گرا در نمودار درختی نشان دهد. از جمله مواردی که در این خصوص تحلیل شده گروه مالکیت، گروه حرف اضافه و گروه کمی‌نما در ز...

متن کامل

پیشنهادی برای تصحیح چند لغت در متون فارسی ـ عبری

یکی از خط‌هایی که پس از اسلام برای نگارش زبان فارسی از آن استفاده شده است خط عبری است که مانند خط‌های دیگر سامی برای ثبت زبان فارسی مناسب نیست. متون فارسیِ نوشته شده به چنین خطی فارسی ـ عبری یا فارسی ـ یهودی نامیده می‌شود. ساختار خط عبری که دارای نویسه‌های مشابه و چندآواست سبب ورود تصحیف و قرائتهای غلط به متون مُصَحَح فارسی ـ عبری شده است. در این مقاله تلاش شده است تعدادی از واژه­‌هایی که مصححان مت...

متن کامل

شناسایی کسره اضافه در متون فارسی برای استفاده در سیستم های تبدیل متن به گفتار

این تحقیق به شناسایی کسره اضافه در متون فارسی اختصاص دارد. روشهای مورد استفاده برای شناسایی کسره اضافه باید به گونه ای باشند که بتوانند بدون محدودیت در کلیه متون مورد استفاده قرار گیرند. همچنین در هنگام تشخیص دارای سرعت مناسبی نیز باشد. برای آموزش و تست روشهای ارایه شده در این تحقیق از پیکره زبان فارسی تهیه شده توسط پژوهشگاه هوشمند علایم استفاده گردیده استکه برای بخش تست آن از 1000 متن این پیکر...

15 صفحه اول

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید


عنوان ژورنال:
پژوهشنامه پردازش و مدیریت اطلاعات

جلد ۳۱، شماره ۴، صفحات ۱۱۲۱-۱۱۴۱

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023